06-04-2024

O mnie

Materiały

Literatura

Plan spotkań

  1. Czym są wizualizacje danych?
  2. Gramatyka grafiki.
  3. Błędy w wizualizacjach danych.
  4. Narzędzia do wizualizacji danych.
  5. Efektywne projektowanie dashboardów.
  6. Zaaawansowane wizualizacje danych.

Plan spotkań

  1. Czym są wizualizacje danych?
  2. Gramatyka grafiki.
    • Praca w grupach.
  3. Błędy w wizualizacjach danych.
    • Praca w grupach.
  4. Narzędzia do wizualizacji danych.
  5. Efektywne projektowanie dashboardów.
  6. Zaaawansowane wizualizacje danych.

Historia wizualizacji danych

Florence Nightingale

Standardy

Joint Committee on Standards for Graphic Presentation (1915). Standards for Graphic Presentation. Publications of the American Statistical Association 14, 790–797.

Czym są wizualizacje danych?

…(a) is based on qualitative or quantitative data and (b) results in an image that is representative of the raw data, which is (c) readable by viewers and supports exploration, examination, and communication of the data…

\(~\)

Źródło: Tarek Azzam, Stephanie Evergreen, Amy A. Germuth, and Susan J. Kistler. Data visualization and evaluation. New Directions for Evaluation, 2013(139):7 32, 2013.

Czym są wizualizacje danych?

…involves presenting data in graphical or pictorial form which makes the information easy to understand…

\(~\)

Źródło: Matthew Sadiku, Adebowale Shadare, Sarhan Musa, Cajetan Akujuobi, and Roy Perry. Data visualization. International Journal of Engineering Research and Advanced Technology (IJERAT), 12:2454 6135, 12 2016.

Czym są wizualizacje danych?

Wizualizacja danych to forma komunikacji. Tak jak każdy komunikat, wykresy muszą być przede wszystkim zrozumiałe dla odbiorcy.

Rodzaje wizualizacji

Wizualizacja statyczna

3D

Infografiki

Wizualizacje interaktywne

Dashboardy

Gramatyka grafiki

Gramatyka grafiki

Gramatyka grafiki (grammar of graphics): ustrukturyzowany opis wizualizacji danych.

Wilkinson, L. (2005). The Grammar of Graphics (New York: Springer-Verlag).

Gramatyka grafiki

Dane

Sepal.Length Sepal.Width Petal.Length Petal.Width Species
5.1 3.5 1.4 0.2 setosa
4.9 3.0 1.4 0.2 setosa
4.7 3.2 1.3 0.2 setosa
4.6 3.1 1.5 0.2 setosa
5.0 3.6 1.4 0.2 setosa
5.4 3.9 1.7 0.4 setosa

Atrybuty wizualne

Atrybuty wizualne (aesthetics): mapowanie danych do osi, kolorów, kształtów.

Atrybuty wizualne

Oś X: Sepal.Length. Oś Y: Sepal.Width.

Atrybuty wizualne

Oś X: Sepal.Length. Oś Y: Sepal.Width. Kolor: Species.

Atrybuty wizualne

Oś X: Sepal.Length. Oś Y: Sepal.Width. Kształt: Species.

Atrybuty wizualne

Oś X: Sepal.Length. Oś Y: Sepal.Width. Kształt: Species. Kolor: Species.

Geometrie

Geometrie: obiekty reprezentujące dane.

Geometrie

Fasety

Dzielenie wykresu na podwykresy w zależności od poziomu zmiennej dyskretnej.

Fasety

Fasety

Wykres poprzedni bez fasetowania.

Fasety

Statystyki

Transformacje danych w celu przypisania ich do atrybutów wizualnych.

Statystyki

Statystyki

Statystyki

Statystyki

Statystyki

Statystyki

Koordynaty

Koordynaty

Motyw

Motyw

Motyw

Motyw

Stylizowanie wizualizacji

  1. Czcionki.
  2. Dodatkowe elementy graficzne.

Czcionki

  1. Czcionka do tytułów/nagłówków.
  2. Treść dokumentu.
  3. Wyróżnianie treści.

Czcionki

Czcionki

Czcionki wykorzystywane przez Tableau są tak dobrane, aby zapewnić maksymalną czytelność przy małych rozmiarach.

Grafiki

Elementy graficzne nawiązujące do treści wzmacniają przekaz i pozwalają lepiej zrozumieć dane.

Grafiki

Gramatyka grafiki

Nazwa Przykłady
Dane (data)
Atrybuty wizualne (aesthetics) Osie, kolory, kształty, typy linii
Geometrie (geometries) Linie, słupki, punkty
Fasety (facets) Podrysunki tworzone na podstawie dyskretnych zmiennych
Statystyki (statistics) Średnie, mediany, kwantyle.
Koordynaty (coordinates) Kartezjański, polarny
Motyw (theme) Wygląd rysunku

Przykłady

voivodeship sex age count year month
WOJ. DOLNOŚLĄSKIE K 16 3 2019 8
WOJ. DOLNOŚLĄSKIE K 17 3 2019 8
WOJ. DOLNOŚLĄSKIE K 18 390 2019 8
  • voivodeship: województwo
  • sex: płeć
  • age: wiek
  • count: liczba uzyskanych praw jazdy
  • year: rok
  • month: miesiąc

Zadanie 1

Błędy w wizualizacjach

Rodzaje złych wizualizacji

  1. Fałszywe (przedstawiające fałszywe informacje)
  2. Mylące (przedstawiające fałszywie rzeczywiste informacje).

Wizualizacje i prawda

How to Lie with Statistics, Darrell Huff

Korelacje i współwystępowanie

Złe wizualizacje

Trudne porównania - niewłaściwie wybrana metoda wizualizacja.

Złe wizualizacje

Niewłaściwie wybrana metoda wizualizacji.

Złe wizualizacje

Zbyt duża ilość informacji na jednym wykresie.

Trzeci wymiar

Wykresy kołowe

Wykresy kołowe

Ucięte osie

Ucięte osie

Kolory

Kolory

Kolory mogą nawiązywać do treści wizualizacji…

Kolory

… ale schemat kolorystyczny powinien być stosowany konsekwentnie.

Kolory

Kolory

Kolory

Widzenie barwne

Kolory

Tableau domyślnie dobiera palety kolorów (zarówno ilościowe jak i kategoryczne), które są łatwo rozróżnialne również dla osób z zaburzeniami widzenia barwnego.

Kolory

Prostota

Nadmiar stylizacji wykresu może zmniejszać czytelność wykresu.

Prostota

Zadanie 2

Narzędzia do wizualizacji

Narzędzia

  1. Programistyczne (R, Python, JavaScript)
  2. Programy graficzne (Inkscape).
  3. Programy dedykowane do wizualizacji danych (Tableau).

Języki wizualizacji danych

Podział narzędzi do wizualizacji danych

Deklaratywne:

  • zadanie: warunki jakie musi spełniać wizualizacja,
  • jak wizualizacja jest wykonywana jest rozstrzygane wewnętrznie i niezależnie od użytkownika,
  • oddzielenie specyfikacji od wykonania.

Imperatywne:

  • zadanie: krok po kroku jak stworzyć wizualizację,
  • użytkownik w pełni kontroluje każdy detal wizualizacji,
  • jeśli warunki jakie musi spełniać wizualizacja zmienią się nawet odrobinę, instrukcja tworzenia może się zmienić znacząco.

Języki wizualizacji danych

Altair (Python)

Altair (Python)

Pythonowe API dla Vega-Lite.

Brian Granger, uzasadniając stworzenie Altaira: I love Python, but do my visualisations using R/ggplot2.

Altair (Python)

bokeh (Python)

bokeh (Python)

  • Python jako API do BokehJS,
  • praca głownie w Pythonie, JSowy silnik mało dostępny i źle udokumentowany,
  • całe dashboardy.

bokeh (R)

Leaflet

Leaflet

matplotlib (Python)

matplotlib (Python)

  • trudne zarządzanie czasem na osiach,
  • niesatysfakcjonujące mapowanie do kształtów.

Rozszerzenia: https://mpld3.github.io/

plot.ly

seaborn

Vega-Lite

Vega

Programy graficzne

AI w wizualizacji danych

Ocena wizualizacji danych

Kontakt